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摘要 ”本文 在 细胞 色素 c 族 蛋 白 和 免疫 球 蛋 白 家 族 中 一 些 蛋 白质 片段 的 序列 比较 和 分 析 的 基 
础 上 ， 遂 过 计算 其 氨基 酸 残 基 的 可 及 性 ， 对 残 基 可 及 性 与 蛋白 质 序 列 及 其 三 维 结构 的 保守 性 之 间 
的 鞠 系 进行 了 分 析 和 探讨 。 结 果 表 明 ， 序 列 中 凡是 保守 的 残 基 ， 其 可 及 性 都 较 低 ， 而 且 这 些 低 可 
及 性 的 保守 性 残 基 与 维持 蛋白 质 特有 的 三 维 结构 相关 。 作 者 认为 ， 同 一 家 族 的 蛋白 质 中 ， 在 进化 
上 相距 较 远 的 各 成 员 之 间 ， 结 构 的 保守 性 主要 是 体现 在 其 三 维 结构 上 ， 序 列 中 的 保守 性 残 基 ， 对 
于 维持 整个 蛋白 质 分 子 特定 的 三 维 结构 和 功能 有 着 重要 的 意义 : 此 外 ， 序 列 中 的 保守 性 残 基 一 般 
均 位 于 其 整个 分 子 结构 的 内 部 ， 因 而 具有 较 低 的 可 及 性 。 鉴 于 “可 及 性 ”本身 只 具有 相对 的 意义 ， 
故 可 及 性 较 低 的 残 基 不 一 定 是 保守 的 ， 而 保守 的 残 基 刚 是 内 可 及 性 的 。 
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蛋白 质 家 族 中 各 成 员 结构 的 保守 性 ， 包 括 其 一 级 结构 (序列 ) 和 三 维 结构 的 保守 性 ， 与 
这 些 成 员 在 分 子 进化 过 程 中 经 历 了 一 系列 的 结构 变化 之 后 ， 仍 能 够 保持 着 相 类 似 的 功能 有 
密切 的 关系 。 研 究 表明 ， 除 了 在 进化 上 较为 保守 的 同 源 蛋白 质 分 子 的 序列 和 三 维 结构 具有 
较 大 的 保守 性 外 ， 一 些 在 进化 上 相距 较 远 的 同一 蛋白 质 家 族 中 分 子 的 序列 也 存在 着 一 些 非 
常 保守 的 残 基 ， 而 对 这 些 在 进化 上 相距 较 远 的 蛋白 质 来 说 ， 它 们 的 三 维 结构 比 其 序列 具有 
更 大 的 保守 性 (Bajaj 等 ，1984)。 蛋 白质 家 族 各 成 员 结构 的 这 种 保守 性 ， 是 由 于 蛋白 质 分 
子 的 功能 对 其 约束 的 结果 。 蛋 白质 的 三 维 结构 与 其 序列 中 各 氨基 酸 残 基 的 物理 、 化 学 性 
质 ， 如 疏水 性 和 可 及 性 等 有 着 密切 的 联系 ， 一 般 说 来 ， 两 种 折 胎 成 为 类 似 三 维 结构 的 气 基 
酸 序 列 具 有 高 度 一 致 的 院 水 性 (Sweet 等 ，1983)。 此 外 ， 溶 剂 不 可 及 的 残 基 比 那些 位 于 分 
子 表面 的 溶剂 可 及 的 残 基 有 较 低 的 突变 率 (Chothia 等 ，1986; Hubbard 等 ，1987! Lim 
等 1989)， 不 同 可 及 性 氨基 酸 残 基 的 变异 性 和 保守 性 大 不 相同 ， 溶 剂 不 可 及 的 残 基 通 常 较 
为 保守 (Overingtong €, 1990, 1992, Topham 等 ，1993)， 因 此 ， 可 及 与 不 可 及 残 基 替 
换 模 式 的 不 同 ， 反 映 了 这 两 类 残 基 保守 性 的 差异 (Wako 等 ，1994)。 为 了 进一步 研究 氨基 
酸 残 基 可 及 性 与 蛋白 质 结构 保守 性 间 的 关系 ， 本 文 在 就 细胞 色素 c 族 蛋 白 和 免疫 球 蛋 白 家 
族 中 一 些 蛋 白质 片段 的 序列 进行 比较 和 分 析 的 基础 上 ， 通 过 计算 其 氨基 酸 残 基 的 可 及 性 ， 
对 残 基 可 及 性 与 蛋白 质 分 子 序列 及 其 三 维 结构 的 保守 性 间 的 关系 问题 进行 了 分 析 和 探讨 。 
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138 动 ww 19 着 
I 10 20 30 40 50 
Tuna | -——- -GDVAKGKKTFVQK -CAQCHTVENGG— KHKVGPNLWGLFGRKTGQAEGYSYTDANKS - --KG-- 
Bonito ------- -GDVAKGKKTFVQK -CAQCHTVENGO-— —--KHKVGPNLWGLFGRKTGQAEGYSYTDANKS -- -KG—— 
Rice  ASFSEAPPGNPKAGEK IFKTK -CAQCHTVDKGA— —— GHKQGPNLNGLFGRQSGTTPGYSYSTANKN- - -MA-—— 
CQ 7 --—-—- EGDAAAGEKV-SKK -CLACHTFDQOO— — - -ANKVGPNLFGVFENTAAEKDNYA YSESYTEMKAKG-- 
C550  ----- -QDGDAAKGEKEF -NK -CKACHMIQAPDGTD ! IKOGKTGPNLYGVVGRK IASEEGFKYGEG ILEVAEKNPD 
C55I ------—- — EDPEVLFKNKGCVACHA IDT -—— —---K-MVGPAYKDVAAKFA-- -— —--------- --- 
C554  -------- ADLAHGOQVESAN-CASCHLOG - -——- ---RNVYNPA -KTL-EKA -----———----------i DL-- 
C555 . ---——--YDAAAGKATYDAS-CAMCEKTGN-— ----- -MGAPKVGDKAA ---———————----------- y-- 
70 80 90 100 
Tuna — IVENNDTLMEYLENPKKY l------PG—TKM- IFAG- IKK-KGERQDLVAYLKSATS--------- 
Bonito IVENEDTLMEYLENPKKY 1--—-PG--TKM- IFAG- IKK-KGERQDLVAYLKSATS--------- 
Rice — VIVEENTLYDYLLNPKKY I-——— -PG--TKM-VFPG-LKK -PQERADL ISYLKEATS - — ---—— 
C2 LTVTEANLAAYVKNPKAFVLEKSODPRAKSEM-TFK --LTK.-DDE IENV IAYLKTLK---------~ 
C550 — LTWIEADLIEVVTDPKPSLVKHTDDKGAKTKM-YFK --MGK —-NOADVVAFLAQNSPDAGGDGEAA 
C551  QAGAEAELAQR IKNGSQGVW -——-—- -GPIPMPPNA-- VS--DDEAQTLAKWYLSQK —-——----- 
C554  DEYOMASIE-AIT-TQVTN——---—-- -GKGAMPAFGAKLS--ADDIEGVASY ALDQSGKES ———- - (a) 
C555 — APHIAKGMNVMVANSIEGYKG------ TKGBMPAKGONPKLTDAQVGNAVAYMYGQSK ————- --— 
I 10 20 30 40 50 60 
* * 
IREI-A (VL) -DIQMTQSPSSLSASVGDRYTITOQASQDI L—--KYLNWYQOTPGKAFK —-LLIYEAS---NLQAGV 
2FAB — (VL) -QSVLTOPPSY -SGAPGORVT LSCTGSSSN I -GAGNHVKWYQOLPGTAPK —LL IFHNN-—--—-- -- 
2FB4 (VL) -ESVLTOPPSA -SGTPGQRVT ISCSOTSSNI -G-S ITVNWYQQLPOMAPK - -LL IYRDA -—MRPSGV 
2FAB (VH) -QVOLEQSGPG -LVRPSQTLSLTCTVSOGTSF-D-DYYSTWYRQPPGRGLEV IGYVFYHG-TSDTDTPL 
2FB4 (VH) -EVQLVQSOOG-VVOPGRSLRLSCSSSGF IF.-S-SY AMYWYRQAPGKGLEWVA I INDDGSDQHYADSV 
D&G «C PTVTLFPPSSEE--LOANKATLVCLISDFYP-G-AVTVAWKADGSPVKAG- -—- -------- VETTK 
2FAB (0) PSVTLFPPSSEE --LOANKATLVCLISDFYP-G-AVTVAWKADSSPVKAG- —- --------- VETIT 
2FB4 (0) PTVTLFPPSSEE --LOANKATLVCL ISDFYP-G-AVTVAWKADGSEVKAG--——-------- VETTK 
2FAB (CH) PSVFPLAPSSKS- -TSOGTAALOCLVKDYFP--E-PVTVSW —NSGALTSG--- —-------- VHTFP 
2FB4 (H) PSVFPLAPSSKS- -TSGGTAALOCLVKDYFP-Q-PVTVSY --NSGALTSG——- - — -------VHTFP 
IFCI-B (CH) POVYTLPPSREE --MIKNQVSLTCLVKGFYP-S-DIAVEW-ESNOQPENN-—- ——- ----- ——- YKTTP 
lFC1-A (CH) PSVFLFPPKPKDTLMISRTPEVTCVVVDVSHEDPQVKFNWYVDGYVQVHNA ———-- ---------- KTKP 
70 80 90 100 110 120 130 
IREI (VL) PSRFSGSGSGTDYT —FT ISSLOPEDIATYYC- -——QQY -QSLPY -T-—FOQGTKLOIT—- ——-- 
2FAB (YL) -ARFSVSKSGSSAT--LÀ ITGLQAEDEADYYC - —--QSYDRSLR--V—--FOGGTKLTVLROPKAA 
2FB4 (Vb) PTRFSGSKSGASAS --LÀ ISGLEAEDESDYYC — — ASWNSSDNSYV ——FOTGTKVTVLGQPRAN 
2FAB (VID RSRVTMLYNTSKNQFSLRLSSVTAADTAVTYC- ———— ARNLIAGCID--VEGQGSLVTYSSASTKG 
2FB4 (VH) KGRFT ISRNDSKNTLFLOMDSLRPEDTGVYFCARDOGHGFCSSASCFGPDYWOQGTPVTVSSASTKG 
IMG (O PSKQSNNKYAASSY --LSLTPEQWKSHRSYSC-—------ -QVTH--E----GSTVEKTVAPTECS- 
2FAB — (CQ) PSKQSNNKYAASSY -- LSLTPEQSRSHKSYSC— ———-- -QVTE--E ----GSTVEKTVAPTECS- 
2FB4 (A) PSKQSNNKYAASSY --LSLTPEQWKSHRSYSC-------- -QVTH--E----GSTVEKTVAPTECS- 
2FAB (CH) AVLQSSGLYSLSSY--VTY-PSSSLGTQTY IC--------- NYNAKPS----NTKYDKKVEPKSC-- 
2FB4 (CH) AVLQSSGLYSLSSY - -YTY-PSSSLGTQTY IC--------- NVNHKPS.----NTKVDKRVEPKSC-- 
IFCI-B (CH) PVLDSDGSFFLYSK -—-LTVDKSRWOQONVESC——- -——---- SVMHEAL - - -HNHYTOKSLSLSPG-- 
]FCI-A «CH) REQQYNSTYRVVSV - -LTVLEQNWLDGKEYKC---——---- KVSNKA - ——-LPAPIEKT ISKAKG- - 
(b) 


图 1 经 对 齐 处 理 后 的 一 些 蛋 白质 序列 


Fig.l Alignments of some protein sequences 
a- 细 胞 色素 c(cytochrome c) bb. 免疫 球 蛋白 (immunoglobulin)。 
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2 材料 与 方法 


21 和 蛋白质 的 晶体 结构 数据 

本 文 所 涉及 的 蛋白 质 晶体 结构 数据 全 部 来 自 Brookhaven 的 PDB 蛋白 质数 据 库 ， 文 中 所 
用 的 蛋白 质 代 码 也 系 该 数据 库 中 各 相应 蛋白 质 的 代码 。 
22 所 基 酸 残 基 可 及 性 的 计算 模型 与 方法 

本 工作 采用 Wodak 等 (1978) 的 蛋白 质 简 化 模型 ， 利 用 Janin 教授 所 提供 的 ASA 微机 程序 
进行 计算 。 计 算 中 所 用 每 个 氨基 酸 球 的 固定 点 数 NGC= 90， 即 每 个 球 的 总 样本 点 数 为 2978， 
水 分 子 探 测 球 的 半径 为 1.4x10mo。 
2.3 ”序列 资料 的 来 源 

本 文中 所 用 细胞 色素 c 及 免疫 球 蛋白 的 全 部 序列 分 别 取 自 Mathews(1985)ffl Johnson 等 
(1990) 论 文中 所 收集 的 序列 。 


3 结果 与 讨论 


31 残 基 可 及 性 与 序列 保守 性 的 关系 

通过 对 细胞 色素 c 及 免疫 球 蛋 白 序列 的 比较 和 分 析 ， 可 以 看 出 ， 在 整个 细胞 色素 c 族 
蛋白 中 有 5 个 位 点 的 残 基 是 保守 的 (图 1]a)， 在 免疫 球 蛋 白 家 族 中 有 3 个 位 点 的 残 基 是 保守 
的 (图 1b)。 在 此 基础 上 ， 我 们 就 表 1 和 表 2 中 所 列举 的 蛋白 质 分 子 的 所 有 残 基 的 可 及 性 进 
行 了 计算 ， 结 果 表 明 ， 凡 是 保守 性 位 点 其 残 基 的 可 及 性 都 较 低 ( 表 1、2)， 但 并非 可 及 性 较 
低 的 残 基 都 是 保守 的 。 由 于 残 基 的 可 及 性 主要 是 与 其 在 整个 蛋白 质 分 子 三 维 结构 中 所 处 的 
位 置 有 关 ， 位 于 分 子 表面 的 较为 暴露 的 残 基 通 常 具有 较 高 的 可 及 性 ， 而 位 于 分 子 内 部 的 较 
为 埋藏 的 残 基 则 可 及 性 较 低 ; 此 外 ， 处 于 同一 位 置 的 相同 残 基 ， 在 同一 蛋白 质 的 不 同 结构 
状态 中 其 可 及 性 也 有 一 定 的 差异 ( 表 3)。 从 序列 比较 和 计算 结果 仍 可 以 看 出 ， 序 列 中 残 基 
的 保守 性 与 其 可 及 性 存在 着 一 定 的 联系 ， 在 序列 中 极度 保守 的 残 基 一 般 都 是 溶剂 不 可 及 的 
残 基 ， 这 进一步 说 明了 “不 同 可 及 性 氨基 酸 残 基 的 变异 性 和 保守 性 大 不 相同 ， 溶 剂 不 可 及 
的 残 基 通 常 较 保 守 " 的 观点 (Overingtong $, 1990, 1992, Topham 等 ，1993)。 


Z1 一 些 细胞 色素 < 族 蛋 白 分 子 序列 的 保守 性 残 基 及 其 可 及 性 (Ac)jd 
Table 1 Conserved residues in cytochrome c sequences and their nccessibilities (Ac)? 


保守 残 基 Ac 保守 残 基 Ac 保守 残 基 Ac 
Cys? 14 20.0 Cy ld 27.8 Cys? 14 34 2 
Cy? 17 26.6 Cy? 17 38.3 Cys? 17 41.2 
Tuna e " Dc m 
Gcr) His? 18 29.0 Bonito His? — 18 49.9 Cao His? — 18 26.8 
30 15.8 Pro 30 26.1 Pro — 30 25.7 
Met — 80 50.0 Met — 80 78.3 Met — 80 41.3 
Cys? 14 90 Cys? 14 14.5 Cys? 14 21.1 
Tue Cys? 17 0.2 Cys? 17 35.5 Cys? 17 30.6 
cup His? — 18 1.9 C, His? 18 26.3 Cs, His? — 18 26.0 
Pro 30 0.0 Pro 30 22.0 Pro 30 20.8 
Met 80 34 Met 80 584 Met 80 53.7 


D 表 中 除 5CYT 为 还 原 态 构象 外 ， 其 余 所 有 细胞 色素 均 为 氢化 态 构 象 {all the listed are 
oxidized cytochromes except reduced 5CY T); 
& 与 血红 素 共 价 结合 的 残 革 (the residues formed covalent bonds with heme), 
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表 2 一 些 免疫 球 蛋 白 可 变 区 与 恒定 区 序列 的 保守 性 残 基 及 其 可 及 性 (Ac): 
Table 2 Conserved residues and their accessibilities (Ac) in some of immunoglobulin 
variable and constant regions" 


保守 残 基 Ac EFRI Àc 保守 残 基 Ac 
C 24 0.7 C 24 0.3 C 24 0.0 
IREI-A 7? 2FAB D 2FB4 一 六 
Trp 40 1.0 Trp 40 0.4 Trp 40 7.1 
(VL) (VH?) (CL) 
Cys 100 0.0 Cys 100 0.0 Cys 100 0.0 
C 24 1.3 Cy 24 1.2 24 1.0 
FOR n 40 0.9 ZEBI S 40 0.0 iim Ed 40 3.9 
T E . E 
(VL! P (VH) SB (CH T 
Cys 100 14 Cys 100 0.0 Cys 100 16 
C 24 05 C 24 0.1 24 0.0 
ara s 40 0.6 SEAB i 40 34 EPA Sa 40 0.8 
vp P l (cL) P (CH) P ' 
Cys 100 0.0 Cys 100 28 Cys 100 0.0 


TX PER HE 2 225 Se FE ER E A fr 8 Se np 25 VLORE Sk RT OR CUV H JUL $9 S f s DX (C L YRü E 6 fer ERCH (SE 
PEXE Call the residues listed are the conserved residues in immunoglobulin light-cham variable region (VLA 
heavy-chain variable region (VLk light-chain constant region (CL) and heavy-chain constant region (CH) 
respectively], 


32 ” 残 基 可 及 性 与 蛋白 质 分 子 三 维 结构 保守 性 的 关系 

蛋白 质 家 族 中 各 成 员 序 列 结构 的 保守 性 ， 是 由 其 三 维 结构 和 功能 的 保守 性 对 其 约束 的 
结果 。 因 此 ， 分 析 蛋 白质 三 维 结构 的 保守 性 ， 将 有 助 于 我 们 更 加 深刻 地 理解 序列 保守 性 的 
实质 。 

研究 表明 ， 细 胞 色素 c 族 蛋白 分 子 都 含有 一 个 共同 的 -Cys- 久 -YCys-His- 顺 序 ， 其 
中 ，Cys、Cys 和 His 这 3 个 残 基 与 血红 素 基 团 是 共 价 结合 的 。 此 外 ， 所 有 这 一 族 的 蛋白 
分 子 都 有 着 类 似 的 三 维 结构 ， 血 红 素 基 团 在 其 整个 结构 中 被 深 庶 埋 藏 而 且 具 有 类 似 的 取向 
(Mathews，1985)。 由 于 血红 素 基 团 的 存在 与 细胞 色素 c 分 子 执行 传输 电子 的 功能 直接 相 
关 ， 为 了 保证 这 种 功能 ， 细 胞 色素 c 分 子 就 必须 维持 能 与 血红 素 基 团 的 结合 相 匹 配 的 空间 
结构 ， 而 要 保证 这 种 特定 三 维 结构 的 存在 ， 序 列 中 就 必须 要 有 “Cys-XX-Y-Cys-His--” 
这 一 特定 顺序 的 存在 。 因 此 ， 从 理论 上 讲 ， 似 平 Cys 14、Cys 17 和 His 18 这 3 个 残 基 应 
比 Pro 30 和 Met 80 这 2 个 残 基 更 为 保守 。 尽 管 细胞 色素 c 族 和 蛋白 各 成 员 序 列 上 差异 很 
X. DUR 5 个 残 基 是 保守 的 (图 1a)， 但 从 它们 分 子 主 链 的 拓扑 结构 图 (Johnson 等 ，1990) 
可 以 看 出 ， 它 们 的 空间 结构 却 是 非常 相似 的 。 因 而 ， 与 血红 素 共 价 结 合 的 Cys 14、Cys 
17 和 His 18 这 3 个 保守 性 残 基 ， 对 于 维持 细胞 色素 c 特有 的 三 维 结构 和 功能 有 着 特别 重 
要 的 音义。 就 表 2 所 列 出 的 免疫 球 蛋 白 可 变 区 和 恒定 区 的 3 个 保守 性 残 基 而 言 ， 其 中 的 2 
个 Cys 残 基 可 相互 间 形 成 二 硫 键 ， 并 因此 分 别 构成 了 免疫 球 蛋白 L-40 H- 链 的 可 变 区 和 
恒定 区 2 个 结构 域 。 这 些 结构 域 对 于 免疫 球 蛋 白 完成 与 其 抗原 的 专 一 性 结合 的 功能 ， 有 着 
非常 重要 的 音义。 此 外 ， 从 其 三 维 结构 的 研究 结果 (Creighton，1983) 来 看 ， 这 3 个 保守 性 
残 基 也 都 是 位 于 各 相应 结构 域 的 内 部 ， 因 而 ， 它 们 的 可 及 性 都 很 低 。 

综 上 所 述 ， 作 者 认为 ， 同 一 家 族 的 蛋白 质 中 ， 在 进化 上 相距 较 远 的 各 成 员 之 间 ， 结 构 
的 保守 性 主要 是 体现 在 其 三 维 结构 上 : 序列 中 的 保守 性 残 基 ， 对 于 维持 整个 蛋白 质 分 子 特 
定 的 三 维 结构 和 功能 有 着 重要 的 意义 ， 一 旦 这 些 残 基 被 改变 或 替换 将 可 能 导致 其 整个 分 子 
的 三 维 结构 发 生变 化 ， 从 而 使 其 失去 原 有 的 分 子 功能 ;此 外 ， 序 列 中 的 保守 性 残 基 一 般 均 
位 于 其 整个 分 子 结构 的 内 部 ， 因 而 具有 较 低 的 可 及 性 。 由 于 “可 及 性 ?本 身 仅 具有 相对 的 意 
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Abstract 


Based on the comparison and analysis on the sequences of cytochrome c family and 
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some domain fragments in immunoglobulin family, the protein amino acid residue ac- 
cessibilities have been calculated. and the relationship between amino acid residue 
accessibilities, protein sequences’ and three-dimensional structural conservativeness has been 
analyzed and discussed. The results indicated that all conserved residues in sequences have 
lower accessibilities, and the conserved residues with lower accessibilities are close correlative 
to keeping protein specific threedimensional structures. It is suggested that protein structural 
conservativeness is mainly expressed in their three—-dimensional structures between evolutiona- 
ry distant various protein molecules within families of proteins, and the conserved residues 
in sequences play an important role to keep specific three-dimensional structure in whole pro- 
tein molecule. In addition, it is found that the conserved residues in sequences are generally 
located in the interior of whole protein molecular structure. This is why their accessibilities 
are lower. Of course. not all lower accessible residues are conserved, but the conserved resi- 
dues are those with lower accessibilities. 

Key words Residue accessibility. Protein family, Conserved residue, Structural con— 


servativeness 
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